Extraction de termes centrée autour de l'expert

نویسندگان

  • Thomas Heitz
  • Mathieu Roche
  • Yves Kodratoff
چکیده

Résumé. Nous développons un logiciel, Exit, capable d’aider un expert à extraire des termes qu’il trouve pertinents dans des textes de spécialité. Tout est mis en place pour faciliter le travail de l’expert afin qu’il puisse consacrer son temps à la seule reconnaissance des termes pertinents. Pour cela, différentes mesures statistiques et de nombreuses options d’extraction sont disponibles dans Exit. Afin d’utiliser au mieux les connaissances de l’expert, notre approche est semi-automatique. De plus, l’expert construit des termes pouvant inclure des termes précédemment extraits ce qui rend itératif et constructif notre processus de formation des termes. Enfin, l’ergonomie du logiciel a profité des enseignements tirés lors de son utilisation pour une compétition internationale d’extraction de connaissances.

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

The Falling Apart of the Tagged Fragment and the Asymptotic Disintegration of the Brownian Height Fragmentation

We present a further analysis of the fragmentation at heights of the normalized Brownian excursion. Specifically we study a representation for the mass of a tagged fragment in terms of a Doob transformation of the 1/2-stable subordinator and use it to study its jumps; this accounts for a description of how a typical fragment falls apart. These results carry over to the height fragmentation of t...

متن کامل

The falling apart of the tagged fragment and the asymptotic disintegration of the Brownian height fragmentation1

We present a further analysis of the fragmentation at heights of the normalized Brownian excursion. Specifically we study a representation for the mass of a tagged fragment in terms of a Doob transformation of the 1/2-stable subordinator and use it to study its jumps; this accounts for a description of how a typical fragment falls apart. These results carry over to the height fragmentation of t...

متن کامل

Une approche centrée graine pour la détection de communautés dans les réseaux multiplexes

Résumé. Nous nous intéressons dans ce travail au problème de détection de communautés dans les réseaux multiplexes. Le modèle de réseau multiplexe a été récemment introduit afin de faciliter la modélisation des réseaux multirelationnels, des réseaux dynamiques et/ou des réseaux attribués. Les approches existantes pour la détection de communautés dans ce genre de graphes sont, pour la plupart, b...

متن کامل

Term Extraction for Ladin: An Example-based Approach

Cette communication traite le problème de l’extraction de termes pour les langues minoritaires. Nous présentons une méthode basée sur des exemples qui fonctionne même si les ressources linguistiques digitales sont rares. Notre méthode se base sur modèles de termes générés à partir d’un nombre limité de termes d’exemple. Les résultats obtenus pour le Ladin du Val Gherdena sont meilleurs que ceux...

متن کامل

Recherche d'information dans des documents structurés par proximité des termes

RÉSUMÉ. Nous présentons une méthode pour calculer un score d’un élément quelconque d’un document structuré qui prend en compte la proximité des termes de la requête dans le texte du document. Plus précisément nous définissons autour de chaque occurrence d’un terme de la requête une fonction d’influence. Pour une occurrence qui apparaît dans le texte proprement dit, cette fonction d’influence dé...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

عنوان ژورنال:

دوره   شماره 

صفحات  -

تاریخ انتشار 2005